แนวคิดหลัก - สมองและมือ
ในห้องปฏิบัติการก่อนหน้า เราเห็นถึงความทรงพลังของโมเดลภาษาขนาดใหญ่ (LLMs) แต่เราก็พบจุดอ่อนหลักหนึ่งคือ พวกมันถูกจำกัดอยู่ในกล่อง พวกเขาทราบเฉพาะสิ่งที่ถูกฝึกสอนมา และไม่สามารถโต้ตอบกับโลกจริงได้
เอเจนต์ปัญญาประดิษฐ์ แก้ปัญหานี้โดยรวมองค์ประกอบสองส่วนที่แตกต่างกันไว้ด้วยกัน:
- สมอง: โมเดลภาษาขนาดใหญ่ (เช่น Qwen3-4B) ซึ่งเข้าใจภาษาของมนุษย์ จัดการตรรกะ และคงสถานะการสนทนาไว้
- มือ: รหัสพีทอนและเครื่องมือภายนอก (API) ที่สามารถโต้ตอบกับโลกจริงได้อย่างกระตือรือร้น เช่น ตรวจสอบสภาพอากาศ ค้นหาข้อมูลบนอินเทอร์เน็ต หรือทำการคำนวณ
การสอนสมองให้ใช้มือ
โมเดลภาษาขนาดใหญ่ไม่สามารถคลิกปุ่มหรือเรียกใช้พีทอนได้โดยธรรมชาติ วันนี้เป้าหมายของเราคือการสอนสมองให้รู้จักเมื่อมันต้องการความช่วยเหลือ และจัดรูปแบบผลลัพธ์ให้โปรแกรมพีทอนของเราสามารถเรียกใช้เครื่องมือนั้นได้ เพื่อ มัน
